В мире математики существуют отношения, которые являются «абсолютными», например, когда радиус окружности определён, площадь автоматически становится фиксированной. Однако в реальной жизни большинство отношений являются «неоднозначными»: если отец выше, то его сын, как правило, тоже выше, но эта связь не является однозначной. Именно это и составляет сутькорреляциипривлекательность. Она описывает наличие некоторого тренда между переменными, при этом допуская случайные колебания. Диаграмма рассеяния — это «микроскоп», способный выявить эти скрытые тенденции.
Основные концепции: различение
Корреляция (Correlation) подразумевает неопределённую связь между переменными. Когда значение одной переменной определено, значение другой переменной остаётся случайным. В то время как функциональная зависимость является определённой, где $y$ полностью определяется $x$.
Наблюдая диаграмму рассеяния (Scatter Plot), мы можем непосредственно оценить связь между переменными:
- Прямая корреляция (Positive): в целом наблюдается «восходящий тренд вправо», при увеличении $x$ значение $y$ стремится возрастать.
- Обратная корреляция (Negative): 整体呈“右下挫”,$x$ 增大时 $y$ 趋于减小。
- Линейная корреляция: точки плотно расположены около прямой линии.
Корреляция не означает причинно-следственную связь! Даже если диаграмма рассеяния показывает сильную корреляцию, это может быть вызвано общим фактором или чистой случайностью. Перед тем как делать выводы, научное логическое обоснование важнее визуального анализа графиков.